序列化表格
-
程序包 hust.cs.javacourse.search.index
-
类hust.cs.javacourse.search.index.AbstractIndex扩展java.lang.Object实现可序列化
-
序列化字段
-
docIdToDocPathMapping
java.util.Map<java.lang.Integer,java.lang.String> docIdToDocPathMapping
内存中的docId和docPath的映射关系, key为docId,value为对应的docPath. TreeMap可以对键值排序 -
termToPostingListMapping
java.util.Map<AbstractTerm,AbstractPostingList> termToPostingListMapping
内存中的倒排索引结构为HashMap,key为Term对象,value为对应的PostingList对象.
-
-
-
类hust.cs.javacourse.search.index.AbstractPosting扩展java.lang.Object实现可序列化
-
序列化字段
-
docId
int docId
包含单词的文档id -
freq
int freq
单词在文档里出现的次数 -
positions
java.util.List<java.lang.Integer> positions
单词在文档里出现的位置列表(以单词为单位进行编号,如第1个单词,第2个单词,...), 单词可能在文档里出现多次,因此需要一个List来保存
-
-
-
类hust.cs.javacourse.search.index.AbstractPostingList扩展java.lang.Object实现可序列化
-
序列化字段
-
list
java.util.List<AbstractPosting> list
Posting列表,Posting必须是AbstractPosting子类型对象
-
-
-
类hust.cs.javacourse.search.index.AbstractTerm扩展java.lang.Object实现可序列化
-
序列化字段
-
content
java.lang.String content
Term内容
-
-
-
-
程序包 hust.cs.javacourse.search.index.impl
-
类hust.cs.javacourse.search.index.impl.Index扩展AbstractIndex实现可序列化
-
序列化方法
-
readObject
public void readObject(java.io.ObjectInputStream in)从二进制文件读 -
writeObject
public void writeObject(java.io.ObjectOutputStream out)写到二进制文件
-
-
-
类hust.cs.javacourse.search.index.impl.Posting扩展AbstractPosting实现可序列化
-
序列化方法
-
readObject
public void readObject(java.io.ObjectInputStream in)从二进制文件读 -
writeObject
public void writeObject(java.io.ObjectOutputStream out)
-
-
-
类hust.cs.javacourse.search.index.impl.PostingList扩展AbstractPostingList实现可序列化
-
序列化方法
-
readObject
public void readObject(java.io.ObjectInputStream in)从二进制文件读 -
writeObject
public void writeObject(java.io.ObjectOutputStream out)写到二进制文件
-
-
-
类hust.cs.javacourse.search.index.impl.Term扩展AbstractTerm实现可序列化
-
序列化方法
-
readObject
public void readObject(java.io.ObjectInputStream in)从二进制文件读 -
writeObject
public void writeObject(java.io.ObjectOutputStream out)写到二进制文件
-
-
-